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Die Erf indung betrifft ein Verfahren und eine Vorrichtung 
zur Urnwandlung eines Textes in eine Wellenform. Insbeson- 
dere betrifft sie die Erzeugung einer Ausgabe in Form einer 
akustischen Welle, namlich synthetischer Sprache, aus einer 
Eingabe in Form von Signalen, die einen herkommlichen Text 
darstellen . 

Diese Gesamturnwandlung ist sehr kompliziert und wird manch- 
mal in mehreren Modulen durchgef iihrt , bei denen der Ausgang 
eines Moduls den Eingang fur das nachste Modul bildet. Das 
erste Modul empfangt Signale, die einen herkommlichen Text 
darstellen, und das Endmodul erzeugt an seinem Ausgang eine 
synthetische Sprache. Diese synthetische Sprache kann eine 
digitale Darstellung der Wellenform, der eine herkommliche 
digital -analoge Urnwandlung folgt, um eine akustische Aus- 
gabe zu erzeugen. In vielen Fallen ist es erwiinscht, die 
akustische Ausgabe iiber ein Telef onsystem zu realisieren. 
In diesem Fall kann es geeignet sein, die Digital -analog- 
Umwandlung nach dem Senden durchzuf uhren, so daS das Sender, 
in digitaler Form s~att f indet . 

Der modulare Aufbau hat Vorueile; z. B. wird jedes Modul 
separat entwickelt und jedes beliebige der Module kann er- 
setzt oder .geandert werden, um die Flexibilitat , Verbesse- 
rungen oder eine Anpassung an geandert e Umstande zu errei- 
chen . 

Derartige Verfahren nutzen eine Folge von drei Modulen, 
namlich 

(A) Voreditieren / 

(B) Urnwandlung von Graphemen in Phoneme, und 
729-54 . 479EP-Du/Ma/Kf 




(C) Umwandlung von Phonemen in (digitale) Wellenf ormen. 



Nachfolgend werden diese Module kurz beschrieben. 

Das Modul (A) empfangt Signale, die einen herkommlichen 
Text darstellen, z. B . den Text dieser Beschreibung, und 
modif iziert ausgewahlte Merkmale. Somit kann das Modul (A) 
bestimmen, welche Nummern verarbeitet werden. Zum Beispiel 
wird es entscheiden, ob 



zu 

eins, drei, vier, fiinf 
dreizehn f unf undvierzig oder 
eintausenddreihundertf unf undvierzig werden . 

Es ist ersichtlich, daS es relativ einfach ist, ver- 
schiedene Formen des Moduls (A) darzustellen, wobei jede 
von ihnen mit den nachf olgenden Modulen kompatibel ist, so 
dafi verschiedene Formen der Ausgabe entstehen. 

Das Modul (B) wandelt Grapheme in Phoneme um . Die "Graphe- 
me" sind Datendarstellungen , die den Symbolen des gewohnli- 
chen Alphabets ennsprechen, die auf gewohnliche Art und 
Weise verwendet werden. Der Text dieser Beschreibung ist 
ein guces Beispiel fur die "Grapheme". Es ist ein Problem 
der synthetischen Sprache, dafi die Grapheme nur geringen 
Bezug zu der Art haben konnen, wie Worter ausgesprochen 
werden, insbesondere in Sprachen wie Englisch. Um Wellen- 
formen zu erzeugen ist es deswegen angebracht, die Grapheme 
in ein anderes Alphabet umzuwandeln, das in dieser Be- 
schreibung "Phoneme" genannt wird, das eine sehr enge Kor- 
relation mit dem Klang der Worter aufweist. Mit anderen 
Worten ist der Zweck des Moduls (B) , das Problem zu losen, 
dafi das gewohnliche Alphabet nicht phonetisch ist. 
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Das Modul (C) wandelt die Phoneme in eine digitale Wellen- 
form urn, die, wie oben erwahnt wurde, in ein Analogformat 
und somit in eine akustische Wellenform umgewandelt werden 
kann. 

Die vorliegende Erfindung betrifft ein Verfahren und eine 
Einrichtung zur Verwendung im Modul (B) , wobei dieses Modul 
jetzt ausf uhrlicher beschrieben wird. 

Das Modul (B) verwendet verkmipfte Datenbanken, die durch 
eine groSe Anzahl von unabhangigen Eintragen gebildet wer- 
den. Jeder Eintrag umfafit Zugrif f sdaten, die in Form von 
Darstellungen, z.B. Bytes, einer Folge von Graphemen 
vorhanden sind, und eine Ausgangskette , die Darstellungen, 
z.B. Bytes, der Phoneme umfaSt die den Graphemen entspre- 
chen, die im Zugrif fsbereich enthalten sind. Ein groSes 
Problem der Umwandlung Grapheme /Phoneme besteht in der 
GroSe der Datenbank, die notwendig ist, urn mit einer Spra- 
che fertig zu werden. Eine einfache und theoretisch ideale 
Losung ware, eine so grofie Datenbank vorzusehen, dafe sie 
einen individuellen Eintrag fur jedes mogliche . Wort in der 
Sprache einschlieSlich samtlicher moglichen Intonationen 
jedes moglichen Wortes in der Sprache aufweist . Selbstver- 
standlich wurde durch Verwendung einer kompletten Daten- 
bank jedes Wort im Eingabetext individuell erkannt und ein 
hervorragendes Phonemaquivalent ausgegeben . Es ist jedoch 
ersichtlich, daS es nicht moglich ist, eine derart kom- 
plette Datenbank zu verwenden. In erster Linie ist es nicht' 
moglich, jedes Wort in einer Sprache zu erfassen und selbst 
wenn ein solches Verzeichnis verfugbar ware, ware es fur 
Computer zwecke zu umfangreich. 

Obwohl die komplette Datenbank nicht realisierbar ist, ist 
es moglich, eine Datenbank von verwendbarer GroSe vorzuse- 
hen, die z.B. gemeinsame Worter und Worter enthalt, deren 





Aussprache bezuglich der Rechtsschreibung nicht einfach 
ist. Eine derartige Datenbank ermoglicht eine hervorragende 
Grapheme/ Phoneme -Umwandlung der darin enthaltenen Worter, 
fallt jedoch bei fehlenden Wortern aus, d.h w erzeugt keine 
Ausgabe. Bei jeder praktischen Anwendung wurde dies eine 
nicht vertretbar hohe Fehlerquote bedeuten. 

Eine andere Moglichkeit verwendet eine Datenbank, in der 
die Zugrif f sdaten kurzen Zeichenf olgen von Graphemen ent- 
sprechen, von denen jede Zeichenf olge mit ihrer aquiva- 
lenten Zeichenfolge von Phonemen verknupft ist. Diese Al- 
ternative verwendet eine verwaltbare Grofie der Datenbank ,- 
es hangt jedoch von der Analyse des Eingabetextes ab, ob 
die darin enthaltenen Zeichenf olgen den Zugrif f sdaten in 
der Datenbank entsprechen. Systeme dieser Art konnen einen 
grofien Anteil an hervorragenden Aussprachen mit leichten 
und einzelnen Aussprachef ehlern gewahrleisten . Auch ist ein 
Anteil an Ausfallen vorhanden, bei denen keine Ausgabe 
erzeugt wird, entweder auf Grund der fehlerhaften Analyse 
oder weil im Zugrif fsbereich der Datenbank eine erforderli- 
che Zeichenfolge vcn Graphemen f ehlt . 

Die letzte Moglichkeit ist ublicherweise als ein Standard- 
Verfahren bekannt , weil sie von n nur dann angewandt wird, 
wenn bevorzugte Verfahren versagen. Ein Standard- Verfahren 
besteht ublicherweise in der "Aussprache" der Symbole des 
Eingabetextes. Da der Bereich der Eingabesymbole nicht nur 
bekannt, sondern auch begrenzt ist (gewohnlich weniger als 
100 und in vielen Fallen weniger als 50), ist es nicht nur 
moglich, die Datenbank zu erzeugen, sondern ist auch deren 
GroSe im Vergleich mit der Kapazitat von modernen Daten- 
speichersystemen sehr klein. Deswegen gewahrleistet dieses 
Standard-Verf ahren eine Ausgabe selbst dann, wenn diese 
Ausgabe nicht die beste Ldsung darstellt , Beispiele bilden 
Namen, in denen Initialen verwendet werden, akademische 




Grade und Ehrentitel, und Abkurzungen von Einheiten, Es 
wird geschatzt, da£ es unter diesen Umstanden ublich ist, 
die Buchstaben "auszusprechen" , wobei das Standard-Ver- 
fahren in diesen Fallen die besten Ergebnisse liefert. 

Bisher wurden drei verschiedene Strategien zur Umwandlung 
von Graphemen in Phoneme ermittelt und es ist wichtig, zu 
begreifen, daS diese Alternativen sich nicht gegenseitig 
ausschliefien. Es ist sogar erwunscht, alle drei Alterna- 
tiven gemaS einer strikten Prioritatsregel zu verwenden. So 
wird als erste die "Ganzwort" -Datenbank verwendet und wenn 
sie eine Ausgabe erzeugt, dann wird diese hervorragend 
sein. Wenn sie ausfallt, wird das "Analyse " -Verfahren ver- 
wendet, das eine kleine, aber annehmbare Anzahl von Aus- 
sprachef ehlern umf aSt . SchlieSlich, wenn das "Analyse" - 
Verfahren versagt , wird die Standard-Option der Aussprache 
der "Buchstaben" verwendet, die garantiert eine Ausgabe 
erzeugt. Obwohl diese Losung nicht ganz zuf riedenstellend 
ist, bietet sie. unter Berucksicht igung der oben erwahnten 
Falle das beste Ergebnis . 

Die vorliegende Erfindung betrifft die mittlere Option von 
der oben beschriebenen Reihenf olge . Das bedeutet, daE diese 
Erfindung die Analyse der Datendarstellungen betrifft, die 
den Eingabete^tgraphemen entsprechen, um einen Ausgabesatz 
von Datendarstellungen zu erzeugen, die dem Eingabetext 
ent sprechende Phoneme sind. Es wird betont, daE das Arbe- 
itsgebiet dieser Erfindung eine vollstandige Text-in- 
Wellenf orm-Umwandlung ist, wie ausf uhrlicher oben beschrie- 
ben wurde . Das bedeutet, dafi diese Erfindung eine besondere 
Komponente des Gesamtsystems betrifft . 

Das Dokument von F. F. Lee (Seiten 333 - 338) , veroffen- 
tlicht In "PROCEEDINGS OF THE SPRING JOINT COMPUTER CON- 
FERENCE" am 30. April 1968 in Atlantic City, NJ, betrifft 



eine durch Computer erzeugte Sprache. Das Dokument be- 
schreibt die Aufspaltung von Wortern in "Morphe". Es wird 
erwahnt, daS wenn zwei Morphe kombiniert werden, die Ande- 
rungen in der Rechtschreibung lediglich im linken Morphen 
erfolgen, so daft es geeignet ist, ein gedrucktes Wort wah- 
rend des Auf spaltungsprozesses von rechts nach links abzu- 
tasten. Die "Morphe" werden alsdie kleinsten bedeutenden 
Einheiten in geschriebener Form def iniert . 

GemaS der vorliegenden Erfindung wird eine Eingabefolge von 
Bytes, z.B. Datendarstellungen, die eine Folge von Zeichen 
darstellen, die aus einem ersten Zeichensatz, wie Graphemen 
ausgewahlt werden, in Unterfolgen aufteilt, zur Umwandlung 
in eine Ausgabefolge von Bytes, z.B. Datendarstellungen, 
die eine Folge von Zeichen darstellen, die aus einem zwei - 
ten Zeichensatz , wie Phonemen, ausgewahlt werden, wobei das 
Verfahren eine riicklaufige Analyse urnfaiSt und dadurch ge- 
kennzeichnet ist, daft die Aufteilung in Verbindung mit Sig- 
naispeichermitteln durchgefiihrt wird, die einen ersten, 
einen zweiten, einen dritten und einen vierten Speicher- 
bereich enthalcen, wobei; 

(i) der erste Speicherbereich rr.ehrere Bytes enthalt, die 
j.eweils ein aus derr. ersten Zeichensatz ausgewahltes 
Zeichen darstellen , 

(ii) der zweite Speicherbereich mehrere Bytes enthalt, die 
jeweils ein aus dem ersten Zeichensatz ausgewahltes 
Zeichen darstellen, wobei sich der Gesamt inhalt des 
zweiten Speicherbereiches von dem Gesamtinhalt des 
ersten Speicherbereiches unterscheidet , 

(iii) der dritte Speicherbereich Folgen enthalt, die je- 
weils aus einem oder mehereren Bytes bestehen, wobei 
das Byte oder das erste Byte jeder Folge im ersten 
Speicherbereich enthalten ist, und 

(iv) der vierte Speicherbereich Folgen enthalt, die je- 
weils aus einem oder mehreren im zweiten Speicher- 



bereich enthaltenen Bytes bestehen. 

Die im ersten Bereich gespeicherten Bytes stellen vorzug- 
sweise Vokale dar, wahrend die Bytes des zweiten Bereichs 
vorzugsweise Konsonanten darstellen. Uberlappungen, z.$. 
der Buchstabe "y", sind moglich. Die Folgen im dritten 
Speicherbereich stellen vorzugsweise "Reime" dar, wahrend 
die Folgen des vierten Speicherbereichs vorzugsweise Wor- 
tanfange darstellen. Die Konzepte von Vokalen, Konsonanten, 
Reimen und Wortanf angen werden nachfolgend ausfuhrlich er- 
lautert. 

Die Aufteilung umfaSt das Vergleichen von Unterfolgen des 
Eingabesignals mit Folgen, die im dritten und vierten 
Speicherbereich enthalten sind. Die Unterfolgen fur den 
Vergleich werden durch Verwendung des ersten und des 
zweiten Speicherbereichs gebildet . 

Die riicklaufige Analyse erf ordert , da£ spater vorkommende 
Unterfolgen vor friiher vorkommenden Unterfolgen ausgewahlt 
werden. Sobald eine Unterfolge ausgewahlt wurde, stehen die 
darin enthaltenen Bytes nicht mehr zur Verfiigung fur die 
Auswahl oder Wieder'auswahl , so daS sie eine fruher vorkom- 
mende Unterfolge bilden. Diese Nicht -Verf iigbarkei t begrenzt 
die Wahl- fur Bildung der Unterfolge, und deswegen bestimmt 
die vorausgehende Auswahl zumindest teilweise die spaters 
Auswahl der f ruheren Unterfolge . 

Das erf indungsgemaSe Verfahren ist besonders geeignet fur 
die Verarbeitung- einer Eingabef olge , die in Blocke auf- 
geteilt ist 7 z.B. Blocke, die Wortern entsprechen, wobei 
ein Block in Segmenten analysiert wird, die am Ende begin- 
nen und zum Beginn hin verarbeitet werden und wobei die 
Auswahl der Segmente vom Ende der restlichen nicht verarbe- 
iteten Folge erfolgt. 



Die Erfindung, die in den Patentanspruchen offenbart wird, 
umfaSt die Verfahren und eine Einrichtung zur Durchfuhrung 
der Verfahren. 

Die Datendarstellungen, z.B. Bytes, die beim erfindungs- 
gemafien Verfahren verwendet werden, nehmen jede beliebige 
Signalform an, die fur Verwendung in Computerschaltungen 
geeignet sind. So konnen die Datendarstellungen durch Sig- 
nale in Form von elektrischem Strom (Ampere) , elektrischem 
Potential (Volt) , magnetischem Feld, elektrischem Feld oder 
elektromagnetischer Strahlung gebildet werden. Zusatzlich 
konnen die Datendarstellungen gespeichert werden, ein- 
schlieSlich eines vorubergehenden Speicherns als Bestand- 
teil der Verarbeitung, in einem geeigneten Speichermedium, 
z.B. als Grad und/oder Orientierung der Magnetisierung in 
einem magnet ischen Medium. 

Nachfolgend werden die theoretische Grundlage und einige 
vorteilhafte Ausfuhrungen der Erfindung beschrieben. Bei 
den vorteilhaf ten Ausfuhrungen werden die Eingangssignale 
in Blocke aufgeteilt, die den einzelnen Wortern des Textes 
entspre.chen und die Erfindung arbeitet separat mic jedem 
Block, so date der Prozess als "Wore - fur-Wort " -Verarbeitung 
angesehen werden kann . 

Nun isi: es angebracht, die Anforderung zu wiederholen, da£ 
es nicht erforderlich 1st, fur jeden der Blocke eine Aus- 
gabe zu erzeugen, da, wie oben erwahnt wurde , das gesamte 
System weitere Module- umfaEt , die mit derartigen Ausf alien 
f ertig werden . 

Als eine Vorprufung ist es sinnvoll, die theoretische 
Grundlage der Erfindung durch Betrachtung der Struktur von 
Wortern in der englischen Sprache und durch Erklarung der 





Strukturen von wenigen spezifischen Wortern darzustellen. 
Diese Analyse verwendet den Unterschied, der gewohnlich als 
"Vokale" und "Konsonanten" dargestellt wird. Fur mechani- 
sche Verarbeitung ist es notwendig, zwei Zeichenverzeich-. 
nisse zu speichern. Eines dieser Verzeichnisse enthalt die 
Zeichen, die als "Vokale" bezeichnet werden, und das andere 
Verzeichnis enthalt diejenigen Zeichen, die als "Konsonan- 
ten" bezeichnet werden. Alle Zeichen sind vorzugsweise in 
einem oder dem anderen Verzeichnis enthalt en, aber bei der 
vorteilhaf ten Ausfuhrung sind die Datendarstellungen, die 
einem "Y" entsprechen, in beiden Verzeichnissen enthalten. 
Der Grund dafiir ist, daS die gewohnliche englische Recht- 
sschreibung den Buchstaben "Y" manchmal als ein Vokal und 
machmal als ein Konsonant verwendet. Somit enthalt das er- 
ste Verzeichnis (der Vokale) a, e, i, o, u und y, wahrend 
das zweite Verzeichnis die Konsonanten b, c, d, f, g, h, j, 
k, 1, m, n, p, q, r, s, t, v, w # x, y, z enthalt. Die Tat- 
sache, daS "Y" in beiden Verzeichnissen vorkommt , bedeutet, 
daS sich die Bedingung "nicht Vokal" von der Bedingung 
" Konsonant " unterscheidet . 

Der primare Zweck der Analyse ist es, einen Block von 
Datendarstellungen, d.h., ein Wort, in Reime und Wortan- 
fange zu teilen. Es ist wichcig zu begreifen, daS die Ana- 
lyse verkniipfte Datenbanken verwendet, die Graphemaqiva- 
iente von Reimen und "Wortanf angen" enthalt, die mit ihren 
Phonemaquivalenten verknupft sind. Der Zweck der Analyse 
ist nicht nur,' die Daten in die Reime und die Wortanf ange 
darstellende willkurliche Folgen zu teilen, sondern in Fol- 
gen, die in der Datenbank enthalten sind. 

Ein Reim bezeichnet eine Folge von einem oder mehreren 

* 

Zeichen, von denen jedes im Verzeichnis der Vokale enthal- 
ten ist, oder eine Folge, der eine zweite Folge von Zeichen 
folgt, die im Verzeichnis der Vokale nicht enthalten sind. 



Eine alternative Erklarung dieser Anforderung ist, daS ein 
Reim aus einer ersten Folge besteht, der eine zweite Folge 
folgt, wobei alle in der ersten Folge enthaltenen Zeichen 
im Verzeichnis der Vokale enthalten sind und die erste 
Folge nicht leer sein darf und die zweite Folge vollstandig 
aus Zeichen besteht, die im Verzeichnis der Vokale nicht 
enthalten sind mit dem Vorbehalt, daS die zweite Folge leer 
sein kann. 

Ein Wortanfang ist eine Folge von Zeichen, von denen alle 
im Verzeichnis der Konsonanten enthalten sind. 

Die Analyse erfordert, da£ das Ende eines Wortes ein Reim 
sein soil. Es ist erlaubt, daS das Wort benachbarte Reime 
enthalt, aber es ist nicht erlaubt, date es benachbarte Wor- 
tanfange enthalt. Es wurde erwahnt, daS das Ende des Wortes 
ein Reim sein mu£, aber es sollte erwahnt werden, daS der 
Anfang des Wortes entweder ein Reim oder ein Wortanfang 
sein kann; z.B. fangt das Wort "orange" mit einem Reim an, 
wahrend das Wort "pear" mit einem Wortanfang beginnt . 



Urn die grundlegende Theorie 
den vier aus der englischen 
Frobeworter dargestellc und 
tanfangs analysierc : 

Erste Probe 
CATS 

Reim "ats" 
Wortanfang "c" 



der Erfindung zu erklaren wer- 
Sprache willkurlich ausgewahlte 
bezuglich ihrer Reime und Wor- 



Es ist zu erwarten, daS "ats" als ein Reim und "c" als ein 
Wortanfang aufgefuhrt werden . Deswegen wird jedes Ersetzen 
durch sein Phonemaquivalent "cats" in Phoneme umwandeln. 



Es soli erwahnt werden, da£ der Reim . "ats" eine erste 
Folge, die aus dem einzelnen Vokal "a" besteht, und eine 
zweite Folge aufweist, die aus zwei Nicht-Vokalen, namlich 
"t und "s" besteht. 

Zweite PrQbe 

STREET 
Reim "eet" 
Wortanfang "str" 

In diesem Fall enthalt die erste Folge des Reims zwei 
Buchstaben, namlich "ee", wahrend die zweite Folge durch 
ein einziges Nicht -Vokal "t" gebildet ist . Der Wortanfang 
besteht aus einer Folge von drei Konsonanten. 
Der Wortanfang "str" und der Reim "eet" sollten beide in 
der Datenbank enthalten sein, so daS Phonemaquivalente 
vorhanden sind. 

Dritte ProbR 
HIGH 

Reim 11 igh" 
Wort anfang " h " 

3ei diesem Beispiel ist der Reim "igh" einer der beliebigen 
Klange der englischen Sprache, aber die Datenbank kann eine 
korrekte Umwandlung in Phoneme gewahrleisten. 

Vierte Probe 
HIGHSTREET 
zweiter Reim "eet" 
zweiter Wortanfang "str 11 
erster Reim "igh" 
erster Wortanfang "h" 



Es ist klar, daS das Wort "highstreet " eine Verbindung der 



vorhergehenden zwei Beispiele ist und seine Analyse diesen 
zwei Beispielen sehr ahnlich ist. Es existiert jedoch eine 
wichtige Sonde ranf orderung, dafi es notwendig ist, zu erken- 
nen, daS eine Unterbrechung zwischen dem vierten und dem 
fiinften Buchstaben vorhanden ist, urn das Wort in "high" und 
"street" aufzuteilen. Diese Aufteilung wird durch den In- 
halt der Datenbank erkannt. Somit ist die Konsonantenf olge 
"ghstr" kein Wortanfang in der englischen Sprache und ist 
deswegen in der Datenbank nicht enthalten, so dafi sie nicht 
erkannt werden kann. Weiter ist auch die Folge "hstr" in 
der Datenbank nicht vorhanden. "str" ist jedoch im Eng- 
lischen ein gewohnlicher Wortanfang und sollte in der 
Datenbank vorhanden sein. 

Deswegen kann "str" als ein Wortanfang erkannt werden und 
"str" ist der letzte Teil der Folge "ghstr" . Sobald das 
Ende der Folge als ein Wortanfang erkannt wurde, wird der 
vordere Teil als Teil des vorhergehenden Reim identif iziert 
und das Wort "high" kann aufgeteilt werden, wie vorhin 
beschrieben wurde. Der Zweck dieses Beispiels ist dar- 
zustellen, dafe die Aufteilung einer internen Konsonanten- 
folge manchmal wichtig ist und daS die Aufteilung durch 
Verwendung der Datenbank erreicht wird. 

Nachdem nun die den erf indungsgemaSen Verfahren zugrunde- 
liegende Theorie beschrieben wurde, isc es angebracht 
aufzuzeigen, wie sie durch Verwendung einer automat ischen 
Computereinrichtung realisiert wird, die in der beliegenden 
diagrammatischen Zeichnung dargestellt ist. 

Die Computereinrichtung arbeitet mit Folgen von Signalen, 
z. B., elektrischen Impulsen. Die kleinste Einheit der Com- 
puterverarbeitung ist eine Signalfolge, die einem einzigen 
Graphemen des Originaltextes entspricht. Zur Vereinf achung 
wird eine derartige Signalfolge als ein "Byte" bezeichnet, 



wobei es unerheblich ist, wieviel Bit im Byte enthalten 
sind. Der Begriff "Byte" bezeichnet normal erweise eine 
Folge von 8 Bit. Da 8 Bit eine Zahl von 255 darstellen kon- 
nen, reicht diese Zahl aus, die meisten Alphabete unter- 
zubringen. Das "Byte" enthalt jedoch nicht unbedingt 8 Bit. 

Die nachfolgend beschriebene Verarbeitung wird blockweise 
durchgefiihrt , wobei ein Block durch eine Folge von einem 
oder mehreren Bytes gebildet ist. Jeder Block entspricht 
einem individuellen Wort (oder einem potentiellen Wort, da 
es moglich ist, daft die Daten Blocke enthalten, die nicht 
ubersetzbar sind, so dafi die Umwandlung ausfallen muB) . Der 
Zweck des Verfahrens ist es, einen Eingabeblock, dessen 
Bytes Grapheme darstellen, in einen Ausgabeblock umzuwan- 
deln, dessen Bytes Phoneme darstellen. Das Verfahren teilt 
den Eingabeblock in Unterfolgen auf, wandelt jede Unter- 
folge in eine Nachschlagetabelle urn und bildet dann Ketten, 
urn den Ausgabeblock zu erzeugen. 

Der Betriebsmodus der Computereinrichtung weist zwei Arbe- 
itsvorgange auf. So weist er einen ersten Vorgang, der zwei 
Phasen umfafit und zum Identif izieren von Bytefolgen verwen- 
det wird, die den Reimen entsprechen. Der zweite Vorgang 
hat nur eine Phase und wird zum Identif izieren von Bytefol- 
gen verwendet, die den Wortanfangen entsprechen. 

Wie in der Zeichnung gezeigt ist, enthalt die Computerein- 
richtung einen Eingabe-Puf fer-Speicher 10, der Blocke von 
der vorhergehenden Verarbeitung so lange halt, bis sie in 
der' Lage sind, verarbeitet zu werden. Der Eingabe-Puf fer- 
Speicher 10 ist mit einem Datenspeicher 11 verbunden und 
stellt dem Datenspeicher 11 auf Anforderung einzelne Blocke 
zur Verfiigung. 

Ein wichtiges Teil der Computereinrichtung ist der Speicher 



12 . Dieser enthalt Programmbef ehle und auch die Datenbanken 
und Verzeichnisse, die zur Durchfuhrung der Verarbeitung 
erforderlich sind. Wie im nachf olgenden Text ausfuhrlich 
erlautert wird, ist der Speicher 12 in mehrere Funktions- 
bereiche unterteilt. 

Die Datenverarbeitungseinrichtung umfafit auch einen Arbeit - 
sspeicher 14, der erforderlich ist, Untersatze von Bytes zu 
halteh, die vom Datenspeicher 11 erhalten werden, zur Ver- 
arbeitung und zum Vergleich mit Bytefolgen, die in im 
Speicher 12 enthaltenen Datenbanken gehal ten werden. Ein- 
zelne Bytes, d.h. Signalf olgen, die einzelnen Graphemen 
entsprechen, werden vom Eingabe-Puf f er-Speicher 10 in den 
Arbeitsspeicher 14 iiber einen Kont roll speicher 13 iiber- 
tragen, der eine Kapazitat von einem Byte auf weist. Vor der 
Ubertragung in den Arbeitsspeicher 14 wird das Byte im Kon- 
trollspeicher 13 mit Verzeichnissen verglichen, die im Dat- 
enspeicher 12 enthalten sind. 

Nach dem erf olgreichen Vergleich mit den im Arbeitsspeicher 
12 enthaltenen Datenfeldern werden die Folgen von dem Arbe- 
itsspeicher 12 in den Ausgabespeicher 15 iibertragen. Fur * 
den Fall, dais die Ubereinst immung nicht stattfindet, en- 
thalt die Einrichtung Mittel zur Ruckfuhrung eines Bytes 
vom Arbeitsspeicher 14 in den Datenspeicher 11. 

Zusatziich zu anderen Bereichen, z. E. fiir Programmbef ehle , 
weist der Speicher 12 vier Hauptspeicherbereiche auf . Diese 
Bereiche werden nun erlautert . 

Zunachst weist der Speicher Bereiche fiir zwei verschiedene 
Verzeichnisse von Bytes auf. Dies sind ein erster Speicher- 
bereich 12.1, der ein Verzeichnis von Bytes enthalt, die 
den Vokalen entsprechen, und ein zweiter Speicherbereich 
12.2, der ein Verzeichnis von Bytes enthalt, die den Konso- 



nanten entsprechen. (Die Vokale sowie die Konsonanten wur- 
den bereits in dieser Beschreibung erlautert) . 

Der Speicher 12 enthalt auch zwei Speicherbereiche, die 
zwei verschiedene und wichtige verkniipfte Datenbanken 
bilden. Die erste ist die "Reim" -Datenbank 12. 3 , die weiter 
in Bereiche unterteilt ist, die mit 12.31, 12.32, 12.33 
usw. bezeiclmet sind. Jeder Bereich hat einen Eingabeteil, 
der Bytefolgen enthalt, die den Reimen in Graphemen ent- 
sprechen, wobei, wie in der Zeichnung dargestellt ist, 
12.31 "ATS" enthalt, 12.32 " EET " enthalt, 12.33 " IGH" en- 
thalt, sowie mehrere Teile, die in der Zeichnung nicht 
dargestellt sind. 

Der Speicher 12 enthalt auch einen zweiten Hauptbereich 
12.4, der Bytefolgen enthalt, die den Wortanfangen entspre- 
chen. Wie bei den Reimen ist die Wortanf ang-Datenbank 12.4 
auch in mehrere Bereiche unterteilt. So zum Beispiel umfaSt 
sie 12.41, die »C" enthalt, 12.42, die "STR" enthalt und 
12.43, die "H" enthalt. 

Jeder der Eingabeteile (von 12.3 und 12.4) ist mit einem 
Ausgabeteil verknupft, der eine Folge von Bytes enthalt, 
die dem Inhalt seines Eingabeteiles entsprechen. 

Es wurde bereits erwahnt, daS das Arbeitsverf ahren zwei 
verschiedene Vorgange umf aSt . Der erste Vorgang benutzt die 
Speicherbereiche 12.1 und 12.3, wahrend der zweite Vorgang 
die Speicherbereiche 12.2 und 12.4 benutzt. Es wird betont , 
daS die Datenbankbereiche, die derzeit verwendet werden, 
vollstandig durch den laufenden Vorgang definiert werden. 
Die Vorgange werden abwechselnd verwendet und der Vorgang 
Nr. 1 wird als erstes verwendet. 



TVPTfiCHES BEI5PIEL 

Analyse des Wortes "HIGHSTREET" 



Es wird bemerkt, daS dieses typische Beispiel das Wort 
betrifft, das als die vierte Probe in der vorhergehenden 
Beschreibung ausgewahlt wurde . Deswegen wurden seine Reime 
und Wortanfange bereits festgelegt und das typische Bei- 
spiel erklart, wie diese durch mechanische Berechnung er« 
re i ch t wurden . 

Die Analyse beginnt, wenn der Eingabe-Puf f er-Speicher 10 
die dem Wort "HIGHSTREET" entsprechende Bytefolge in den 
Datenspeicher 12 iibertragt. Somit sehen die Inhalte der 
wichtigen Speicher zu Beginn des Prozesses wie folgt aus : 

SPSICHER 
11 
13 
14 
15 

(Das Zeichen " - - " bedeutet , daS der entsprechende Speicher 
leer isc) . 

Die Analyse beginnt mit dem ersten Vorgang, weil eine Ana- 
lyse immer mit dem ersten Vorgang beginnt . Wie oben erwahnt 
wurde, benuczt der erste Vorgang die Speicherbereiche 12.1 
und 12.3. Der erste Vorgang hat zwei Phasen, wahrend derer 
Bytes vom Datenspeicher 11 in den Arbeitsspeicher 14 uber 
den Kontrollspeicher 13 ubertragen werden. Die erste Phase 
wird so lange fortgesetzt, bis im Speicherbereich 12.1 
keine Bytes gefunden werden. 

Der Vorgang lauft riickwarts ab, was bedeutet, dafi er am 
Ende des Wortes beginnt, so daS als erstes das "T" iiber- 



INHALT 
HIGHSTREET 



tragen wird, das im Bereich 12,1 nicht enthalten ist. Als 
zweites wird das "E" ubertragen, das im Bereich 12.1 en- 
thalten ist, wodurch die zweite Phase des ersten Vorgangs 
eingeleitet wird. Dies wird so lange fortgesetzt, bis das 
Byte im Arbeitsspeicher 14 mit 12.1 ubereinstimmt , so daS 
das zweite "E" ubertragen wird, aber die Uberprufung aus- 
fallt, wenn das nachste Byte !I R" durchlauft. In diesem Sta- 
dium sieht der Zustand der Speicher wie folgt aus . 

SPEICHER XNBALT 
11 HIGHST 

13 R 

14 EET 

15 .... 

Die Inhalte des Arbeitsspeichers 14 werden zum Zugriff auf 
den Speicherbereich 12.3 verwendet , wobei eine Ubereinstim- 
mung im Bereich 12.32 stattfindet. Somit hat die Uberein- 
stimmung stattgef unden und der Inhalt des Arbeitsspeichers 
14, namlich "EET" wird in einen Bereich des Ausgangsspeich- 
ers 15 ubertragen, so daS der Zustand der Speicher folgen- 
dermaSen aussieht . 

SPEICHER INHALT ■ 

11 HIGHST 

13 R ' 

14 - 

15 EET 

Es wird gemerkt f daS das erste Reim mechanisch gef unden 
wurde . 



Wie oben erwahnt wurde, wurde durch die Nicht -Uberein- 
stimmung von "R" im Kontrollspeicher 13 die erste Durch- 
fuhrung des ersten Vorgangs beendet. Die Analyse wird fort- 



gesetzt, aber nun wird der zweite Vorgang verwendet, weil 
die zwei Vorgange imrner abwechselnd durchgefuhrt werden. 
Der zweite Vorgang verwendet die Speicherbereiche 12.2 und 
12.4. Das dem "R" entsprechende Byte im Kontrollspeicher 13 
stimmt nun iiberein, da nun der Bereich 12.2 benutzt wird 
und dieses Byte darin enthalten ist . Deswegen wird "R w in 
den Arbeitsspeicher 14 iibertragen und der zweite Vorgang 
wird so lange fortgesetzt, bis eine Ubereinstimmung des 
Bytes im Kontrollspeicher 13 stattfindet. Sornit werden alle 
Buchstaben "T", "S", "H" und "G M uber den Kontrollspeicher 

13 ubertragen. In diesem Augenblick kommt das dem "I" ent- 
sprechende Byte in den Kontrollspeicher 13 und die Uber- 
priifung entfallt, da das dem "I" entsprechende Byte nicht 
im Speicherbereich 12 . 2enthalten ist. Da die Uberprufung 
entfallt, wird die Durchfuhrung des zweiten Vorgangs been- 
det . Die Inhalte der Speicher sehen f olgendermaSen aus. 

SPEICHER INHALT 
11 
13 
14 
1 5 

Der zweite Vorgang wird versuchen, den Inhale des Arbeit- 
sspeichers 14 miz der in 12.4 enthaltenen Datenbank zu ver- 
gleichen; es wird jedoch keine Ubereinstimmung erreichc. 
Deswegen wird der zweice Vorgang mit seinem Bedarfsteil 
fortgesetzt, wobei die Bytes iiber den Kontrollspeicher 13 
zuruck in den Datenspeicher 11 ubertragen werden. Bei jeder 
Ubertragung wird versucht , den Inhalt des Arbeitsspeichers 

14 in den Speicherbereich 12.4 zu bringen. Eine Uberein- 
stimmung wird erreicht, wenn die Buchstaben G und H zuruck- 
gefiihrt wurden, weil die dem "STR" aquivalente Folge im 
Bereich 12.42 enthalten ist. Nachdem eine Ubereinstimmung 
erreicht wurde, wird der Inhalt des Arbeitsspeichers in 



"H" 

M J It 

"GHSTR" 
" EET " 



einen Bereich des Ausgabespeichers 15 ausgegeben. Zu dies em 
Zeitpunkt sieht der Inhalt der Speicher f olgendermaSen aus. 



SPEICHER 



11 



HIG" 



13 



14 



15 



tl 



STR" und 



"EET" 



Der zweite Vorgang wurde durch Erreichen der Ubereinstim- 
mung beendet, so dafi die Analyse nun zum ersten Vorgang 
zuruckkehrt, insbesondere zur ersten Phase des ersten Vor- 
gangs. Auf diese Weise werden die Buchstaben "H M und "G" in 
den Arbeitsspeicher 14 ubertragen und die erste Phase en- 
det . Die zweite Phase laSt "I" durch und wird beendet, wenn 
"H" in den Kontrollspeicher 13 ubertragen wurde. In diesem 
Stadium weisen die Speicher die folgenden Inhalte auf. 

SPEICHER INHALT 

11 - 

13 " H" 

14 "IGH" 

15 "STR" und " EET" . 

Der erste Vorgang versucht nun, den Inhalt des Arbeit- 
sspeichers 14 mit der Datenbank im Speicherbereich 12.3 zu 
vergleichen, wobei eine Ubereinst immung im Bereich 12.33 
erreicht wird. Deswegen wird der Inhalt des Arbeitsspeich- 
ers 14 in einen Bereich des Ausgabespeichers 15 ubertragen. 

Die Analyse wird nun mit dem zweiten Vorgang fortgesetzt 
und der Buchstabe «H" (im Kontrollspeicher 13) wird in den 
Speicherbereich 12.2 gebracht (merke, daS dieser Bereich 
nun verwendet wird, da die Analyse zum zweiten Vorgang 
zuruckgekehrt ist) . Die Analyse kann jetzt beendet werden, 



da der Datenspeicher 11 keine weiteren Bytes zur Ubertra- 
gung beinhaltet und der Inhalt des Arbeitsspeichers, nam- 
lich "H", im Bereich 12.43 des Hauptspeichers 12 gefunden 
wird. Sotnit wird "H" zum Ausgabespeicher 15 tibertragen, der 
die korrekten vier Folgen enthalt, die durch mechanische 
Analyse gefunden wurden. 

Nachdem die erf orderlichen Ausgabef olgen in die richtige 
Lage gebracht wurden, ist es lediglich notwendig, sie auf 
Grund der Tatsache umzuwandeln, daS die Speicherbereiche 
12.3 und 12.4 verkniipfte Datenbanken sind. Jeder Bereich 
enthalt nicht nur die Folgen, die nun im Ausgabespeicher 
enthalten sind, sondern sind mit jedem Bereich Ausgabe- 
bereiche verkmipft, die Folgen enthalten, die den geeig- 
neten Phonemen entsprechen. Deswegen wird jede Folge im 
Ausgabespeicher zum Zugriff auf ihren geeigneten Bereich 
verwendet und erzeugt somit die erf orderl iche Ausgabe . Der 
Endschritt verwendet lediglich eine Nachschlagetabelle und 
dies ist deswegen moglich, weil die wichtige Analyse been- 
det wurde . 

Wie cben erwahnc wurde, dienen die idenc i f izierten Folgen 
als Zugriff auf die verkniipfte Datenbank und _n einem ein- 
fachen System exisrierc fur jede Zugr if f sf olge eine Ausga- 
bef olge. Die Aussprache hangc jedoch manchmal vom Kontext 
ab und eine bessere Um wand lung kann durch Verwendung mehre - 
rer Ausgaben fur mindescens einige der Zugr if fsf olgen er- 
reicht werden . Die Auswahl des geeigneten Ausgabestroms 
hangt von der Analyse. des Kontextes des Zugriff sstroms ab, 
d.h., von der Berucksicht igung der Position im Wort oder 
davon, was folgt oder was fortgesetzt wird. Diese weitere 
Komplikation beeinflufit die Erfindung nicht, die sich le- 
diglich mit der Aufteilung in geeignete Bereiche befafit. 
Sie kompliziert lediglich den Nachschlageprozess . 



Wie oben erlautert wurde, ist die Erfindung nicht unbedingt 
erf orderlich, um eine Ausgabe zu erzeugen, weil in einem 
Fehlerfall das ganze System ein Standard-Verf ahren enthalt, 
das z. B. ein Phonem zur Verfugung stellt, das jedem Gra- 
phem Equivalent ist . Um die Beschreibung des Verf ahrens zu 
erganzen ist es erwunscht/ eine kurze Erlauterung des Um- 
stands zu geben, bei dem der Fehlerfall eintritt und die 
Verwendung des Standard-Verf ahrens erf orderlich ist. 

Der erste Fehlermodus tritt auf, wenn der Inhalt des Dateh- 
speichers kein Vokal enthalt, was darauf schlieSen lafit, 
daS der Inhalt kein Wort darstellt . Wie immer beginnt die 
Analyse mit dem ersten Vorgang und insbesondere mit der 
ersten Phase des ersten Vorgangs und wird so lange fortge- 
setzt werden, bis keine Ubereinstimmung mit dem ersten 
Verzeichnis 12.1 stattf indet . Da die Folge und der Daten- 
speicher 11 keine Ubereinstimmung enthalten, wird die erste 
Phase bis zum Anfang des Wortes fortgesetzt und dies be- 
deutet, dafi ein Fehler auf tritt . 

Zweiter Fehlermodus 

Dieser Fehler tritt auf, wenn: 

(i) der zweite Vorgang lauft; 

(ii) der Anfang des Wortes erreicht wird und; 

(iii) keine Ubereinstimmung fur den Inhalt des Arbeits- 
speichers 14 in der Datenbank 12.4 existiert. 

Dies steht im Gegensatz zum Ubereinstimmungsf ehler in der 
Mitte des Wortes, der darauf schlieSen lafit, dai5 im Kon- 
trollspeicher 13 ein Vokal enthalten ist. Ein Fehler in 
diesem Stadium ermoglicht eine Riickfuhrung von Bytes fur 
eine spatere Analyse durch den ersten Vorgang und wird, zu- 
mindest in diesem Punkt der Analyse, nicht als Fehler ange- 
sehen. Wenn der Anfang des Wortes erreicht ist, besteht 



keine Moglichkeit einer weiteren Analyse, so dafi die Ana- 
lyse entfallen muS. 



Dri titer Fehlermodus 

Der dritte Fehlermodus tritt auf, wenn der erste Vorgang 
lauft und wenn es nicht moglich ist, die Inhalte des Arbe- 
itsspeichers 14 mit einer in der Datenbank 12.3 enthaltenen 
Folge in Ubereinstimmung zu bringen. Unter die sen Umstanden 
wird der erste Vorgang Bytes zuriick zum Kontrollspeicher 13 
und zum Datenspeicher 11 ubertragen und diese Ubertragung 
kann so lange fortgesetzt werden, bis der Arbeitsspeicher 
14 leer ist und die Analyse somit entfallt. 

Im zweiten Fehlermodus wurde erlautert, daS der zweite Ab- 
lauf in der Lage ist, Bytes zur spateren Analyse durch den 
zweiten Vorgang an den Eingang zuriick zu bringen. Die liber- 
tragenen Bytes mussen jedoch zu einem bestimmten Zeitpunkt, 
d.h., wahrend der nachsten Durchfuhrung des ersten Vorgangs 
iibereinst immen . Der dritte Fehlermodus entspricht dem Fall, 
in dem es nicht moglich ist, die spatere Ubereinstimmung zu 
erreichen . 

Das erfindungsgemaSe Verfahren fiihrt somit eine Aufteilung 
einer Datenfolge in Segmence durch, die durch Verwendung 
von Nachschlagetabellen umgewandeU werden konnen. Es ist 
nicht notwendig, daS die Aufteilung in jedem Fall zu erfol- 
gen hat, aber unter der Vorausetzung, daS hochwertige Da- 
tenbanken verwendec werden, das Verfahren sehr schnell ar- 
beiten und die Leistung des gesamten Systems erhohen wird, 
das andere Module aufweist, die fur die Umwandlung eines 
Textes in eine Sprache erforderlich sind. 




EP 0 691 023 

Patentanspruche 

1. Verfahren zur Verarbeitung eines Eingangssignals , das aus 
einer Folge von Bytes besteht, die jeweils einem Zeichen 
aus einem ersten Zeichensatz entsprechen, una Unterfolgen 
fur eine Umwandlung in ein Ausgangssignal zu identifizie- 
ren, das eine Folge von Zeichen d^rstellt, die aus einem 
sich von dem ersten Zeichensatz unterscheidenden zweiten 
Zeichensatz ausgewahlt werden, wobei das Verfahren das 
Eingangssignal durch eine riicklaufige Analyse in Unter- 
folgen aufteilt, 
dadurch gekennzeichnet , - dafi 

die Aufteilung in Verbindung mit einer Datenbank in Form 
von Signalen durchgefiihrt wird, die in einem ersten, 
zweiten, dritten und vierten Speicherbereich gespeichert 
sind, wobei : 

(i) der erste Speicherbereich (12.1) mehrere Bytes ent- 
halt, die jeweils ein aus dem ers:en Zeichensatz 
ausgewahltes Zeichen darstellen, 

(ii) der zweite Speicherbereich (12.2) mehrere Bytes 
enthalc, die jeweils ein aus dem ersten Zeichensatz 
ausgewahltes Zeichen dars tellen , wobei sich der Ge - 
samtinhalt des zweiten Speicherbereiches von dem 
Gesamtinhalt des ersten Speicherbereiches unter- 
scheidet, 

(iii) der dritte Speicherbereich (12.3) Folgen enthalt, 
die jeweils aus einem oder mehreren Bytes bestehen, 
wobei das Byte oder das erste Byte jeder Folge im 
ersten Speicherbereich enthalten ist, und 

(iv) der vierte Speicherbereich (12.4) Folgen enthalt, 
die jeweils aus einem oder mehreren im zweiten 
Speicherbereich enthaltenen Bytes bestehen, 

die Aufteilung das Vergleichen von Unterfolgen (12.3, 
12.4, 14) des Eingangssignals mit Folgen aufweist, die in 



dem dritten und vierten Bereich der Signalspeicher- 
einrichtung enthalten sind, und Auswahlen von spater vor- 
Jcommenden Unterfolgen vor fruher vorkommenden Unterfol- 
gen, wobei die vorherige Auswahl einer spateren Unterfol- 
ge zumindest teilweise die Auswahl einer fruheren Unter- 
folge definiert, 

die Unterfolgen fur den Vergleich durch Vergleichen 
(12.1, 12.2, 13) von Bytes des Eingangssignals mit den 
Inhalten des ersten und des zweiten Speicherbereiches ge- 
bildet werden, um Unterfolgen, die mit einem im ersten 
Speicherbereich enthaltenen Byte anfangen oder aus diesem 
bestehen, und andere Folgen zu bilden, die vollstandig 
aus im zweiten Speicherbereich enthaltenen Bytes beste- 
hen . 

Verfahren nach Anspruch 1, bei dem das Eingangssignal in 
Blocke aufgeteilt wird und die Verarbeitung von zumindest 
einigen dieser Blocke aufweist ; 

(a) Identif izieren einer inneren Folge von aufeinander- 
folgenden Bytes, die jeweils im zweiten Speicherbe- 
reich enchalten sind, wobei die Folge unmittelbar an 
eir- im ersten Speicherbereich enchaitenes vorangehen- 
des Byte anschlieSt, und unmittelbar einem im ersten 
Speicherbereich enthaltenen nachfolgenden Byte vor- 
ausgeht , 

(b) Identif izieren der Folge mit dem langsten Ende aus 
der inneren Folge mit einer Fclge, die im vierten 
Speicherbereich enthalten ist, 

(c) Definieren eines Anfangsteils der inneren Folge als 
den nach der in (b) definierten Abtrennung der End- 
f olge verbleibenden Rest , 

(d) Identif izieren einer Folge aus einem oder mehreren 
auf einanderfolgenden Bytes, die jeweils im ersten 
Speicherbereich enthalten sind, wobei die Folge das 
in (a) identif izierte vorangehende Byte enthalt, und 



(e) Verbinden des in (c) identif izierten Anfangsteils mit 
der in (d) identif izierten Folge, urn eine im dritten 
Speicherbereich gespeicherte Folge zu erzeugen. 

Verf ahren. nach Anspruch 1 Oder 2, bei dem jede im dritten 
Speicherbereich enthaltene Folge aus einer Primarfolge 
und einer nachf olgenden Sekundarf olge besteht, wobei die 
Primarfolge aus im ersten Speicherbereich enthaltenen 
Bytes besteht und die zweite Folge entweder leer ist oder 
aus im zweiten Speicherbereich enthaltenen Bytes besteht. 

Verf ahren zur Umwandlung eines Eingangssignals , das eine 
Folge von aus dem ersten Zeichensatz ausgewahlten Zeichen 
darstellt, in ein aquivalentes Signal, das eine Folge von 
aus dem zweiten Zeichensatz ausgewahlten Zeichen dar- 
stellt, mit Identif izieren von Unterfolgen durch ein Ver- 
f ahren nach einem der vorangehenden Anspriiche, und Umwan- 
deln der Unterfolgen mittels einer verbundenen Datenbank, 
die Eingangsabschnitte mit jeweils einer der Unterfolgen 
enthalt, wobei jeder Eingangsabschnitt mit einem Aus- 
gangsabschnitt verbunden ist, der die zum Inhalt des Ein- 
gangsabschnitts aquivalente Ausgabe enthalt. 

Verf ahren nach Anspruch 4, bei dem das Eingangssignal in 
Eingangsblocke aufgeteilt wird und bei dem jeder Block 
fur sich- umgewandelt wird, wobei zumindesc einige der 
Blocke als Ganzes ohne Unterteilung umgewandelt werden 
und zumindest einige der Blocke durch ein Verfahren nach 
Anspruch 4 umgewandelt werden. 

Zweiteilige Datenbank zum Einfugen in eine Sprachtnaschine 
zur Durchfuhrung eines Verfahrens nach Anspruch 4 oder 5, 
wobei die Datenbank als in Signalspeichereinrichtungen 
gespeicherte Signale ausgebildet ist und aufweist: 
(i) eineh ersten Speicherbereich (12.1), der mehrere 

Bytes enthalt, die jeweils ein aus dem ersten Zei- 
chensatz ausgewahltes Zeichen darstellen, 



« 




(ii) einen zweiten Speicherbereich (12.2), der mehrere 
Bytes enthalt, die jeweils. ein aus dem ersten Zei- 
chensatz ausgewahltes Zeichen darstellen, wobei 
sich der Gesamtinhalt des zweiten Speicherbereiches 
von dem Gesamtinhalt des ersten Speicherbereiches 
unterscheidet , 

(iii) einen dritten Speicherbereich (12.3), der aus einem 
oder mehreren Bytes bestehende Zeichen enthalt, wo- 
bei das Byte oder das erste Byte jeder Folge im er- 
sten Speicherbereich enthalten ist, jede im dritten 
Speicherbereich (12.3) enthaltene Folge mit einem 
Ausgangsregister verbunden ist, das eine Folge aus 
einem oder mehreren Bytes enthalt, die jeweils ein 
Zeichen des zweiten Zeichensatzes darstellen, und 
das Zeichen im Ausgangsregister eine Umwandlung der 
im dritten Speicherbereich (12.3) enthaltenen ver- 
bundenen Folge darstellt, und 

(iv) einen vierten Speicherbereich (12.4), der aus einem 
oder mehreren, im zweiten Speicherbereich enthalte- 
nen Bytes bestehende Folgen enthalt, die mit einem 
Ausgangsregister verbunden sind, das eine Folge aus 
einem oder mehreren 3ytes enthalt, die jeweils ein 
Zeichen des zweiten Zeichensatzes darstellen, wobei 
die Folge im Ausgangsregister eine Umwandlung der 
im vierten Speicherbereich (12.4) enthaltenen ver- 
bundenen Folge darstellt . 

7. ' Zweiteilige Datenbank nach Anspruch 6, bei der jede im 

dritten Speicherbereich enthaltene Folge aus einer Pri- 
marfolge und einer nachf olgenden Sekundarf olge besteht, 
wobei die "Primarfolge aus im ersten Speicherbereich ent- 
haltenen Bytes besteht und die. Sekundarf olge entweder 
leer ist oder aus im zweiten Speicherbereich enthaltenen 
Bytes besteht. 

8. Sprachmaschine, die eine 2weiteilige Datenbank nach An- 
spruch 6 oder 7 enthalt . 
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